ویرایش گر متن شریف: سامانۀ ویرایش و خطایابی املایی زبان فارسی

نویسندگان

بهرام وزیرنژاد

دانشگاه صنعتی شریف، ساختمان ابن سینا، طبقه چهارم، مرکز زبان ها و زبان شناسی فاطمه سلطانزاده

دانشگاه صنعتی شریف، ساختمان ابن سینا، طبقه چهارم، مرکز زبان ها و زبان شناسی محسن مهدوی

دانشگاه صنعتی شریف، ساختمان ابن سینا، طبقه چهارم، مرکز زبان ها و زبان شناسی مهدی مرادی

دانشگاه صنعتی شریف، ساختمان ابن سینا، طبقه چهارم، مرکز زبان ها و زبان شناسی

چکیده

در مقالۀ حاضر سامانه ای هوشمند جهت ویرایش و خطایابی املایی متون فارسی معرفی شده است. هدف از طراحی و ایجاد این سامانه، ویرایش متون فارسی برای کاربردهای پردازش زبان طبیعی است. این سامانه بر مبنای یک رویکرد مهندسی قابل توسعه، از سه زیرسامانه تشکیل شده است: ویرایش گر متن فارسی معیار، خطایاب املایی خودکار زبان فارسی و ستاک یاب واژگان زبان فارسی. این سه بخش با یکدیگر در تعاملند؛ بدین شکل که ابتدا ستاک واژه های متن شناسایی می شود و در صورت عدم وجود ستاک در فهرست واژه های زبان، واژۀ مذکور به عنوان واژه ای نادرست شناسایی خواهد شد و سپس خطایاب خودکار فهرستی از واژه های جایگزین را پیشنهاد خواهد کرد. در زیرسامانۀ ویرایش گر، متن موجود ویرایش شده و متنی یکپارچه که منطبق بر معیارهای مصوب فرهنگستان زبان و ادب فارسی است، به کاربر ارائه خواهد شد. نتایج ارزیابی نشان دهندۀ دقتی بسیار خوب در حدود 95% در ستاک یابی کلمات، 92% در ویرایش و 96% در خطایابی املایی زبان فارسی است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ویرایش‌گر متن شریف: سامانۀ ویرایش و خطایابی املایی زبان فارسی

In this paper, we will introduce an intelligent system to edit and spell check Persian texts. The goal is editing and preprocessing Persian texts for natural language processing tasks. This system is based on an expandable and engineering approach and is composed of three subsystems: Persian text editor, spell checker and stemmer. These parts interact with each other to edit texts. To do this, ...

متن کامل

بیانیه‌ی هلسینکی ویرایش 2008، ترجمه‌ی فارسی و چالش‌‌های آن

The Declaration of Helsinki, the most creditable ethical guideline for medical research on human subjects, has been updated 8 times since its establishment and the last revision was in 2008. Researchers, medical research subjects, authors, members of ethics committees, and editors of medical journals must be informed of the tenets of the Helsinki declaration in order to improve achievements of ...

متن کامل

ویژگی های روانسنجی نسخه فارسی یازدهمین ویرایش مقیاس تکانشگری بارت

هدف از این پژوهش، تبیین شاخص‌های روان سنجی فرم فارسی مقیاس تکانشگری بارت (11BIS-) بوده است. این مقیاس روی یک گروه 259 نفری دانشجویان دانشگاه شیراز (174مرد، 85 زن) که به شیوه نمونه در دسترس انتخاب شده بود، اجرا گردید. به منظور بررسی ساختار عاملی این مقیاس از روش تحلیل عامل اکتشافی به با روش مؤلفه های اصلی چرخش واریماکس استفاده شد. نتایج این تحلیل حاکی از وجود سه عامل با نام های تکانشگری عدم برنا...

متن کامل

ویرایش 2013 بیانیه‌ی هلسینکی و چالش‌ها و تغییرات آن نسبت به ویرایش 2008

The Declaration of Helsinki is one of the most important international documents in medical research ethics on human subjects which has been revised 7 times and the last revision was in 2013. Researchers must be informed of the principle of Helsinki declaration and the latest changes in order to respect the rights of participants in medical research. In this study, the last version of the decla...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
پردازش علائم و داده ها

جلد ۱۲، شماره ۴، صفحات ۴۳-۵۲

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023